Model Selection

Self-supervised pretraining

# Self-supervised pretraining

voc2vec is a foundational model specifically designed for non-linguistic human data, built on the wav2vec 2.0 framework, with a pretraining dataset covering approximately 125 hours of non-linguistic audio.

Audio Classification

Transformers English

Regnety 320.seer

RegNetY-32GF feature extraction model, pretrained on 2 billion random web images using SEER method, suitable for image classification and feature extraction tasks

Image Classification

This Vision Transformer model is pretrained using the MSN method and excels in few-shot scenarios, suitable for tasks like image classification

Image Classification

Regnet Y 1280 Seer In1k

RegNet image classification model trained on ImageNet-1k using self-supervised pretraining and fine-tuning methods

Image Classification

Xlm Roberta Xxl

XLM-RoBERTa-XL is a multilingual model pretrained on 2.5TB of filtered CommonCrawl data covering 100 languages, based on an extra-large version of the RoBERTa architecture.

Large Language Model

Transformers Supports Multiple Languages

Core Clinical Mortality Prediction

The CORe model is based on the BioBERT architecture, specifically pretrained on clinical records, disease descriptions, and medical literature for predicting in-hospital mortality risk.

Text Classification

Transformers English

Beit Large Patch16 224

BEiT is an image classification model based on Vision Transformer (ViT) architecture, pretrained with self-supervised learning on ImageNet-21k and fine-tuned on ImageNet-1k.

Image Classification

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase